FILTER MODE ACTIVE

#фильтрация данных

Найдено записей: 3

#фильтрация данных29.06.2025

Создание модульного конвейера анализа данных с Lilac: функциональное программирование для чистых и масштабируемых инсайтов

Подробное руководство по созданию функционального конвейера анализа данных с использованием Lilac и Python, с акцентом на модульность и переиспользуемость кода для трансформации и фильтрации данных.

#фильтрация данных09.06.2025

Яндекс представляет Alchemist: Компактный датасет для улучшения качества моделей текст-в-изображение

Яндекс представил Alchemist — компактный датасет для дообучения, который значительно улучшает качество моделей текст-в-изображение благодаря новому подходу отбора данных с помощью диффузионной модели.

#фильтрация данных15.05.2025

Ultra-FineWeb: Триллионный датасет, улучшающий точность LLM на нескольких языках

Университет Цинхуа и ModelBest представили Ultra-FineWeb — триллионный многоязычный датасет, значительно повышающий точность крупных языковых моделей благодаря инновационной фильтрации данных.